淺析搜索引擎蜘蛛概念
發(fā)布時(shí)間:2013-02-04 瀏覽:304打印字號(hào):大中小
搜索引擎蜘蛛是搜索引擎自身的一個(gè)程序,它的作用是對(duì)網(wǎng)站的網(wǎng)頁(yè)進(jìn)行訪問(wèn),抓取網(wǎng)頁(yè)的文字、圖片等信息,建立一個(gè)數(shù)據(jù)庫(kù),反饋給搜索引擎,當(dāng)用戶搜索的時(shí)候,搜索引擎就會(huì)把收集到的信息過(guò)濾,通過(guò)復(fù)雜的排序算法將它認(rèn)為對(duì)用戶最有用的信息呈現(xiàn)出來(lái)。深入分析網(wǎng)站的SEO表現(xiàn)的時(shí)候,一般我們就會(huì)考慮搜索引擎蜘蛛的抓取質(zhì)量,而其中能夠幫我們優(yōu)化網(wǎng)站可能會(huì)涉及到下面的幾個(gè)蜘蛛抓取相關(guān)的概念:
1.爬取率:既定時(shí)間內(nèi)網(wǎng)站被蜘蛛獲取的頁(yè)面數(shù)量。
2.爬取頻率:搜索引擎多久對(duì)網(wǎng)站或單個(gè)網(wǎng)頁(yè)發(fā)起一次新的爬行。
3.爬取深度:一個(gè)蜘蛛從開始位置可以點(diǎn)擊到多深。
4.爬取飽和度:唯一頁(yè)面被獲取的數(shù)量。
5.爬取優(yōu)先:那些頁(yè)面最常作為蜘蛛的入口。
6.爬取冗余度:網(wǎng)站一般被多少蜘蛛同時(shí)爬取。
7.爬取mapping:蜘蛛爬取路徑還原。
搜索引擎蜘蛛的爬取頻率很多時(shí)候是由網(wǎng)站內(nèi)容質(zhì)量決定的,因?yàn)橹挥芯W(wǎng)站有更新鮮更好的內(nèi)容,才能更吸引蜘蛛來(lái)反復(fù)抓取,例如很多大型的內(nèi)容型網(wǎng)站,每天更新大量的內(nèi)容,這樣就把蜘蛛一直留在了站內(nèi),頁(yè)面抓取的頻率自然會(huì)提高。而提升了爬取頻率,對(duì)于頁(yè)面中內(nèi)容和鏈接的更新就會(huì)被搜索引擎蜘蛛更快的抓取到,能夠更充分的收錄網(wǎng)站的頁(yè)面內(nèi)容信息。
搜索引擎蜘蛛的爬取深度如果不夠深,主要是因?yàn)榫W(wǎng)站在結(jié)構(gòu)布局的時(shí)候沒(méi)有考慮到這蜘蛛是否能夠充分抓取或者是否按照一層一層的抓取,這里就涉及到鏈接入口的布局,也就會(huì)考慮到蜘蛛爬取優(yōu)先的一些入口,很多時(shí)候?qū)σ恍┐蟮木W(wǎng)站做診斷,來(lái)提升其流量和收錄主要的策略布局就是優(yōu)化蜘蛛抓取優(yōu)先的入口,實(shí)現(xiàn)的方法就是采用nofollow標(biāo)簽屏蔽一些頁(yè)面。還需要分析的可能是爬取的飽和度,因?yàn)閷?duì)于單個(gè)頁(yè)面的爬取太多是在浪費(fèi)蜘蛛資源,我們?nèi)绻軌蜻m當(dāng)?shù)目刂七@些資源的分配,那么對(duì)于頁(yè)面的抓取和收錄的提升肯定有很大的幫助。
- 1網(wǎng)站內(nèi)容收錄后被刪除的解決方法
- 2北京網(wǎng)站設(shè)計(jì)公司哪家好
- 3網(wǎng)站優(yōu)化如何提高關(guān)鍵詞排名
- 4北京網(wǎng)站設(shè)計(jì)公司:企業(yè)網(wǎng)站忽視十大重要優(yōu)化重點(diǎn)
- 5北京網(wǎng)站建設(shè):SEO優(yōu)化對(duì)企業(yè)營(yíng)銷的重要性
- 6北京網(wǎng)站制作公司談網(wǎng)站草圖設(shè)計(jì)
- 7北京網(wǎng)站制作公司-Robots協(xié)議到底要不要寫
- 8北京電商網(wǎng)站建設(shè)公司
- 9企業(yè)網(wǎng)站關(guān)鍵詞優(yōu)化方法
- 10如何設(shè)置網(wǎng)站標(biāo)題更利于SEO優(yōu)化


